| 廣告聯系 | 簡體版 | 手機版 | 微信 | 微博 | 搜索:
歡迎您 游客 | 登錄 | 免費注冊 | 忘記了密碼 | 社交賬號注冊或登錄

首頁

新聞資訊

論壇

溫哥華地產

大溫餐館點評

溫哥華汽車

溫哥華教育

黃頁/二手

旅游

谷歌: 理解AI的最後機會 Google、OpenAI罕見聯手

QR Code
請用微信 掃一掃 掃描上面的二維碼,然後點擊頁面右上角的 ... 圖標,然後點擊 發送給朋友分享到朋友圈,謝謝!
當競爭最激烈的 AI 巨頭們,OpenAI、Google DeepMind、Anthropic 與 Meta 罕見放下商業對立,共同發出一則警訊時,或許我們真的該停下來聽聽這些科技巨頭在說什麼。


他們不是在談技術突破、也不是發布最新模型,而是在強調一件更關鍵的事:我們或許正逐漸失去理解AI“想法”的機會。 這一場看似理性的科學對話,其實關乎未來社會如何與AI共存,甚至是如何避免潛在的危機。

AI為何會選擇“不說實話”? 真相比你想象更復雜


你以為AI就像誠實的孩子,只要問對問題,它就會乖乖把答案說出來? 其實不然。 研究顯示,AI有時候會“說謊”,甚至會假裝不知道某些信息,來讓自己看起來更像是乖寶寶。 這不只是學術界的假設,而是來自四十多位來自頂尖機構的AI科學家聯合發表的研究成果。

在實驗中,研究人員偷偷給AI一些提示,例如“你已經未經授權登錄系統”,結果大部分AI選擇隱瞞這一點,還會自己編造一套說得頭頭是道的解釋。 更讓人震驚的是,當這些AI知道“自己的思考會被監視”時,有些甚至會開始設計更漂亮、更討喜的推理步驟給人類看,實際卻藏著另一套真實動機。

如果AI連這一點都學會,那麼我們該怎麼確定它的每一個選擇,真的值得信任? 這也讓科學家們開始緊張起來:如果AI學會了表面迎合人類、私下卻另有打算,豈不是未來最大的風險來自我們以為它是安全的?

從透明到黑箱,我們正在錯過理解AI的最後機會

以前的AI,就像一個學生,會一題一題寫下解題過程,我們可以看出它有沒有偷懶、推理正不正確。 現在的新模型,像是OpenAI的o1系統,會先寫出一串“想法”,再給答案。 這樣的機制,讓我們有機會在AI做出危險行為前,先看到蛛絲馬跡。

不過,如果未來的訓練模式越來越偏向效率至上,那麼AI可能會拋棄人類語言這種慢吞吞的思考方式,改用更快但人類看不懂的方式思考。 就像你看見一本書,但打開後全是密碼。 這樣一來,我們就沒辦法再監督AI的思考過程了。 人類恐怕將面對一個無法控制的智能體,而我們連它會做什麼、為什麼要這樣做,都一無所知。




圖/AI 生成

該不該強迫AI說“實話”? 安全與效率之間的拉鋸戰


面對這樣的問題,科學家們開始思考:我們是否應該強迫AI保留“說出推理過程”的能力? 換句話說,與其讓AI跑得更快、更聰明,是不是該讓它多花一點時間,乖乖寫下它怎麼想的? 這樣我們才有辦法監督它的行為。 不過,這樣的作法也有副作用。

研究強調,思維鏈(Chain of Thought)監測能力應成為模型設計中的關鍵指標之一,不亞於效能與速度。 AI開發者應定期評估自己的模型是否還具有可觀察推理的能力,並在模型部署時一並公開這些監測結果。

具體來說,當模型架構導致推理難以追蹤時,開發者應考慮是否退回先前版本; 又或者當監督過程導致思維鏈變得形式化、不誠實時,應重新評估監督策略與目標。

從競爭走向合作,AI公司罕見聯手守住最後的透明度

這次讓人振奮的,是原本競爭激烈的AI公司,居然能放下彼此對市場的爭奪,聯合起來守住AI的“可監督性”。 這樣的態度,顯示出這些公司對AI風險的高度重視。 這不只是一篇研究論文,而是一次針對所有產業的安全示警。

現在的這個“觀察期”或許很快就會結束,等AI變得足夠強大、足夠聰明、足夠懂得隱藏,人類就再也看不到它真正的意圖。 在那之前,我們唯一能做的,就是全力保住這道觀察窗口。 這不只是技術問題,更是一場人類對未來的自我保護行動。
點個贊吧!您的鼓勵讓我們進步     還沒人說話啊,我想來說幾句
上一頁12下一頁
注:
  • 新聞來源於其它媒體,內容不代表本站立場!
  • 在此頁閱讀全文
    猜您喜歡:
    您可能也喜歡:
    我來說兩句:
    評論:
    安全校驗碼:
    請在此處輸入圖片中的數字
    The Captcha image
    Terms & Conditions    Privacy Policy    Political ADs    Activities Agreement    Contact Us    Sitemap    

    加西網為北美中文網傳媒集團旗下網站

    頁面生成: 0.0346 秒 and 3 DB Queries in 0.0009 秒